2019年诺贝尔经济学奖得主到底做了什么?外行小白指南
订阅 不成熟研究
换个角度搞懂身边事
“实验”是检验真理的
唯一标准
作者:罗雨翔
不成熟研究(公众号ID:PSR-26)
转载请联系授权(微信ID:lyxluo)
每年到了诺贝尔颁奖时,朋友圈都会刷屏。但鉴于我和大部分人一样,物理化学等自然学科的水平在高中之后就处于逐年递减的状态,一般在诺奖揭晓时也就只能蹭蹭文学奖的热度,跟风惋(数)惜(落)一下村上春树。
经济学则很奇怪。
照理来说,它是一门关于社会的学科,应该让人很有共鸣、谁都可以来聊两句才对。但鉴于其理论化(以及数学化)的程度之深,经济学着实让外行人感到非常难以琢磨。
不过今年的诺贝尔奖或许有点不同(获奖者是来自麻省理工的神级夫妇Abhijit Banerjee和Esther Duflo以及隔壁哈大的Michael Kremer)。官方给他们的颁奖词是:
“表彰其在全球扶贫问题上使用的实验型方法(for their experimental approach to alleviating global poverty)”
这句话的重点在于,他们获得经济学的至高荣誉并不是因为创造了什么新的高深理论,而是因为使用了某种方法。
那么,到底什么是诺奖表彰的“实验型的方法”呢?这种方法在经济学乃至是其他社会科学中,为什么重要?
我作为城市规划从业者,是非经济学专业的外行小白。在获悉今年诺奖结果时,突然想到其实当年在政府学院上课时,曾经学习过这种方法。如果你也是外行人,但对经济学以及社会科学话题感兴趣的话,那么这篇文章或许可以作为一个引子,简单地聊聊这种经济学方法。
1 因为所以,科学道理
经济学属于社会科学(social science)。当代社会科学的重点课题常常是对各种因果关系的研究:
是什么造成了国家之间的贫富差距?
地铁对房价有怎样的影响?
读博士是否会让人的政治倾向更加偏“左”?
给学生提供营养午餐能否提高他们的考试合格率……
但是,要想确定事物之间是否存在因果关系其实是非常困难的。
打个比方,如果你想研究某教育政策A对学生考试合格率的影响,你要怎么着手调查呢?
你是否可以找到两个不同学校的学生,对第一组实施政策A,第二组作对照组(不实施政策A),然后比较这两个学校学生的考试合格率?
不能。
这是因为:这两组学生可能存在一些本质区别,且这些区别造成了他们最终考试合格率的不同。比方说,如果政策A其实本身并没有什么用,但接受政策A的那个学校是重点中学,其学生全都是学霸,那么以上这种简单粗暴的研究方法就会让人误判政策A的效果。
那你可否只对一组学生施以政策A,然后比较同一群人之前和之后的考试合格率呢?如果这群学生在接受政策A之后提高了自身的考试合格率,那这是否可以证明政策A是有效的呢?
答案仍然是否定的。这是因为:同样的一组学生,在不同的时间点,可能也存在着各种各样的不同特质。打个比方,如果在政策A实施之后,试卷上的题目突然变容易了/这群学生大脑发育更快了/食堂的伙食突然变好了,那么考试合格率的提升则有可能其实是由这些其他因素引起的,任何观测到的数据都不能作为政策A有用的决定性证据。
要想严肃认真地研究政策A到底有没有用,我们需要找到可靠的学生来进行对比。
对于接受了政策A的某同学——小明,之前的阐述表明:他隔壁班未接受政策A的小红不能用来跟他做对比,甚至连过去那个未接受政策A的自己也不能用来对比。那么,究竟谁能来跟小明做对比呢?
其实,只有小明自己能跟自己做对比——对于接受了政策A的小明来说,只有那个在平行宇宙中、同一时间、同一地点、除了没有接受政策A以外其他所有情况都相同的“小明2号”能用来做对比。
平行宇宙中的小明2号和小明本尊除了政策A的影响之外,其他任何方面都是完全一致的。所以如果他俩之间的考试成绩不同,那一定就可以确定是政策A有效无误了——因为除此之外,这两个小明不存在任何其他的差异可以用来解释考试结果的不同。
用经济学的术语来说,小明2号叫做小明本尊在政策A问题上的counterfactual。这个概念有点难用某个现成的中文词来翻译,它的字面意思是“如果某件事没有发生的话,情况会是如何”。平行宇宙中的小明2号是政策A的counterfactual,因为他代表了如果政策A不实行的话,学生会是怎样的情况。
社会科学中对因果关系的研究,最关键也最难的一部分就是为研究的现象找到合适的counterfactual。要知道:真正完美、理想的counterfactual总是得不到的——小明2号并不存在于这个世界,他只存在于平行宇宙之中。
所以,这是否说明,除非我们可以穿越到平行宇宙中去采集数据,我们就真的无法研究任何社会问题了?
2 随机对照实验
其实不然,在现实世界中,我们虽然到不了平行宇宙,但可以人为地模拟出近似平行宇宙的情况。方法就是随机对照实验(randomized control trial,简称RCT)。
让我们继续来用政策A举例:不同的学生个体(如小明和小红)之间存在各种区别,因此他们不能作为政策A的counterfactual。但如果你把小明全校的学生随机分成两组(通过抽签、掷色子等方法),第一组接受政策A,第二组不接受,那么你就可以有非常不错的counterfactual了。
这是因为,虽然每个学生之间都有各自的区别,但是通过随机分配的方法,第一组和第二组的学生站在整体统计的角度来说,会是非常相似的。
随机分配,意未着学生的分组不会受到任何现实因素的影响,每个人接受政策A的几率都是50%。所以随机分配可以保证:
换句话说,接受政策A的那组学生和对照组相比,在性别、学习能力、家庭收入、血型、喜好、星座等方面都是有着相等的构成。同时,由于分组是完全随机的,除了以上这些因素以外,其他那些外部观测不到的学生特质(如晚上做梦的时间长度)也会均匀分布在这两组之间。
于是,随机分配得到的这两组学生在各项指标都会有一模一样的平均值,相当于平行宇宙的小明和小明2号,是很好的counterfactual——这两组学生之间考试合格率要是有任何的不同,则可被认定是由于政策A造成的,因为除了政策A之外,这两组学生不存在其他的区别可以解释考试成绩的不同了。
因为“随机”能达到模拟平行宇宙、得到高质量counterfactual的效果,所以在经济学中,随机对照实验被认为是建立因果关系、检验政策效果的黄金准则。
事实上,随机对照试验本来就是诞生于医学界,最初是被用来研究药物是否真的能治病。将随机原理用于经济学等社会科学,让学者除了在理论层面对社会现象进行演绎之外,还能在真实的社会中像医生那样做实验,并观测其结果,理解事物之间的因果关系,并对政策有没有用做出判断。
3 诺奖得主的现实操作
2019年诺贝尔经济学奖得主Banerjee和Duflo成立的扶贫实验室Abdul Latif Jameel Poverty Action Lab(J-PAL)就是这样运用随机对照实验的方法研究全球贫困的原理和检测各种扶贫政策的效用的。
J-PAL实验室的研究内容涵盖很广,以下是他们近期的一些课题:
农业:雨水收集能帮助小农脱贫致富吗?(针对非洲尼日尔2880名农民的研究)
犯罪:暑期打工项目能减少青少年犯罪吗?(针对美国芝加哥5444名高中生的研究)
教育:高科技教育工具能提高学生的成绩吗?(针对印度619名中学生的研究)
环境:集体式资源管理能促进当地经济社会发展吗?(针对非洲纳米比亚1250个畜牧家庭的研究)
金融:加大小微贷款的额度能促进经济发展吗?(针对埃及1000名借款人的研究)
企业:管理咨询能提高企业的生产力吗?(针对墨西哥432个中小企业的研究)
性别:教授女孩谈判技巧能帮助她们提高学习成绩吗?(针对非洲赞比亚2400名初中女生的研究)
健康:社区医疗能改善居民的健康水平吗?(针对非洲乌干达8100个农村家庭的研究)
劳工:职业咨询能提高就业率吗?(针对法国17666人的研究)
政治:培训能让诚实、有能力的年轻人更想去竞选公职吗?(针对菲律宾569人的研究)
J-PAL实验室所做的事情,既是“化大为小”,又是“化小为大”。
以往的发展经济学(development economics)通常是从贸易、就业率等宏观议题入手,而J-PAL实验室却在从微观经济学的角度,一点点地对穷人的行为和生活进行研究。此乃化大为小。
但是,虽然J-PAL实验室的课题很微观,但是在真实的社会中进行经济政策的随机对照实验其实是件相当花钱、费精力的事。
以随机对照实验为基础的发展经济学研究,无法仅仅依靠现有的政府统计数据来进行分析;研究人员需要到实地,对实验对象进行分组、采集事前数据、对实验组进行政策试点、观测并采集事后数据、进行数据分析,同时还要对实验过程中可能出现的各种问题(实验对象跨组互相影响、不合作等)做出应对措施……整个过程复杂、耗时、需要大量的人力、物力以及政治资源——这样一来,看似微小的课题其实都会是个大项目,所以遗憾的是,并不是任何人都能有资本做得了随机对照实验。此乃化小为大。
诺贝尔经济学奖在2019年表彰了随机对照实验这种研究方法,或许会让更多的学者、组织以及政府对“扶贫政策有没有用,实验检测因果关系才知道”这种态度和主张给予关注。
结语 经济学之外的世界
如果你是本公众号的长期读者,你或许会意识到,不成熟研究的第一篇文章《建筑为什么不一定可以改变人们的生活》就是在讨论因果关系的确立以及其误读造成的结果。
不只是建筑师、规划师,很多时候,人们都会希望自己的所作所为能对这个世界产生积极的影响——即尝试证明特定的行为和社会问题的改善之间存在某种因果关系。
其实,不管是在各种社论、行研报告里,还是在PPT、规划设计书里,我们所看到大部分的因果关系证明都是极不严谨、漏洞百出的(缺乏可靠的counterfactual)。
可惜的是,并不是所有的社会问题和相关的解决方法,都能够运用随机对照实验来进行研究——如果受检验的政策是基于空间、针对群体的(如保障房、社区更新、城市群计划、西部大开发),那么研究者就很难将实验对象以随机的方式分成实验组和对照组。随机对照实验的研究课题大多是上学、看病等以个人为单位的经济行为,而少见空间政策(place-based interventions)的研究。
不过,对于非经济学出身的外行人来说,我想随机对照实验最大的价值并不是其对于一般问题来说到底有多可行,而在于:它是一种宝贵的思维模式,让我们重新审视因果关系的确立,并告诉我们要去对很多平时觉得理所当然的东西产生怀疑。政策到底有没有用?在复杂的社会中,事物之间到底存在怎样的联系?……我们要如何才能比现在更加接近真相呢?
文:罗雨翔
图片来自网络
往期文章列表(共23期)
► 美国城市档案 ◄
► 中国城市思考 ◄
► 行业吐(感)槽(悟) ◄
► 无用百科全书 ◄
► 书目推荐 ◄